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[摘要 ] 单 样本 率 比 较 ( 单 组 目标 值 法 ) 的 样本 量 计算 常见 的 方法 为 正 态 近似 法 ， 有 时 
伴 相 应 的 数据 转换 如 平方 根 反 正弦 转换 ， 而 确切 概率 法 通常 需要 商业 统计 软件 寻 值 或 编程 
实现 。 本 文 利 用 免费 软件 R 语言 编程 实现 单 样本 率 比较 确切 概率 法 计算 样本 量 ， 并 且 考 虑 
到 了 确切 概率 法 计算 时 检验 效能 与 样本 量 非 单调 递增 的 关系 ， 直 接 给 出 计算 结果 ， 也 可 作 
图 直观 显示 检验 效能 与 样本 量 的 关系 ， 希 望 能 有 助 于 这 类 研究 的 有 效 开 展 。 

[关键 词 ] 单 组 目标 值 ， 单 样本 率 比较 ， 样 本 量 计算 ; 确切 概率 法 ，R 语言 
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[Abstract] The common method of sample size calculation for single proportion comparison 
(performance goal) is normal asymptotic approach, sometimes with corresponding data 
transformation such as squared arcsine, while exact probability usually needs commercial 
statistics software or programming. We use the free software R to calculate the sample size for 
single proportion via exact probability, and considering of the non-monotone increasing 
relationship between power and sample size with exact probability, we provide intuitive figure 
demonstration besides giving direct calculation results. We hope this will facilitate study design 
with performance goal. 
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当前 的 临床 研究 设计 中 单 组 目标 值 法 (performance goal, PG) 的 应 用 越 来 广泛 。 对 于 
计数 资料 的 单 组 目标 值 法 ， 从 统计 学 角度 来 看 其 实 就 是 单 样本 率 的 比较 ， 其 样本 量 计 算 常 
见 的 为 正 态 近似 法 及 平方 根 反 正弦 转换 法 。 如 果 要 进行 确切 概率 计算 ， 实现 起 来 仍 有 些 麻 
烦 。 国 内 已 有 作者 利用 SAS8 3 或 Statag 软 件 编程 计算 ， 有 些 也 考虑 到 了 确切 概率 法 计算 时 
检验 效能 与 样本 量 的 非 单调 递增 关系 &43。 本 文 介绍 单 样本 率 比 较 的 样本 量 计算 确切 概率 法 
的 R 语 言 (3.4.0 版 本 ) 实现 。 


原理 与 R 语 言 编 程 
单 样本 率 比较 确切 概率 法 基本 思路 为 基于 累计 二 项 分 布 计算 检验 效能 ， 参 考 文献 给 出 
的 计算 公式 钙 ， 我 们 编写 R 语言 程序 如 下 : 
# 首 先 建 立 函 数 exactpow 计算 检验 效能 
exactpow<-function(side,alpha,p0,p1nj{ 
if(side==1&p1>pO){ 
k<-n 
while (1-pbinom(k,n,p0)<=alpha){ #pbinom 为 R 语 言 函数 ， 计 算 二 项 分 布 的 概率 
k=k-1 
} 
power=1-pbinom(k+1,n,p1) 
} 
if(side==1&p1<pO){ 
k<-0 
while (pbinom(k,n,p0)<=alpha)t{ 


k=k+1 
} 
power=pbinom(k-1,n,p1) 
} 
if(side==2){ 
k1<-0 
while (pbinom(k1,n,p0)<=alpha/2){ 
k1=k1+1 
} 
k2<-n 
while (1-(pbinom(k2,n,p0))<=alpha/2){ 
k2=k2-1 
} 
power=pbinom(k1-1,n,p1)+1-pbinom(k2+1,n,p1) 
} 
return(power) 
} 
# 然 后 根据 检验 效能 ， 建 立 函数 exactn 求 样本 量 
exactn<-function(side,alpha, beta,p0,p1,i){ 
power<-1 
while (power>1-beta){ 
power<-exactpow!(side,alpha,p0,p1,i) 
i=i-1 
} 
return(i+2) 
} 
注意 ， 单 样本 率 比 较 的 样本 量 计算 ， 检 验 效能 随 样 本 量 的 增加 呈现 锯 具 状 增加 中， 这 
里 R 语 言 编 程 的 思路 是 从 一 个 较 大 的 样本 量 开 始 (比如 i 取 值 2000)， ， 向 下 寻 值 直到 检验 
效能 低 于 设 定 值 (比如 0.8) ， 然 后 再 返回 上 一 个 值 ， 即 为 所 求 样 本 量 。 
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实例 1 

该 例 来 自 文献 吕 ， 为 验证 某 一 治疗 肝癌 的 组 合 治疗 方案 是 否 有 效 ， 拟 进行 临床 试验 设 
计 。 根 据 以 往 研究 数据 获知 ， 肝 癌 的 5 年 生存 率 为 50%， 研 究 者 预期 新 的 组 合 治 疗 方案 能 
使 肝癌 的 5 年 生存 率 提高 至 60%， 试 按照 检验 效能 为 80%、 检 验 水 准 为 0.05 的 双 侧 检验 估 
计 本 试验 所 需 样 本 量 。 原 文 利用 nQuery 软件 ， 在 相应 的 样本 量 n 一 行 反 复 尝试 填 入 不 同 数 
据 ， 直 至 获得 检验 效能 达到 或 超过 80% 即 为 所 求 样 本 量 最 终结 果 是 208 例 。 原 文 又 用 SAS 
编程 计算 ， 将 n=207 和 n=208 分 别 带 入 程序 ， 得 到 的 检验 效能 分 别 为 0.79110 和 0.81396。 

利用 R 语 言 计 算 如 下 : 

> exactn(side=2,alpha=0.05,beta=0.2,p0=0.5,p1=0.6,i=2000) 


[1] 210 
结果 为 210， 与 原文 略 有 差异 。 我 们 利用 R 语 言 计算 样本 量 为 207，208，209 和 210 
时 的 检验 效能 : 


> exactpow(side=2,alpha=0.05,p0=0.5,p1=0.6,n=207) 
[1] 0.791098 

> exactpow(side=2,alpha=0.05,p0=0.5,p1=0.6,n=208) 
[1] 0.8139611 

> exactpow(side=2,alpha=0.05,p0=0.5,p1=0.6,n=209) 
[1] 0.7979761 

> exactpow(side=2,alpha=0.05,p0=0.5,p1=0.6,n=210) 
[1] 0.8202484 
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可 见 样本 量 207 和 208 时 的 检验 效能 与 原文 SAs 寻 值 的 结果 完全 一 样 ， 而 样本 量 增加 
至 209 时 检验 效能 又 跌 至 0.8 以 下 ， 待 样本 量 增加 至 210 时 ， 检 验 效能 升 至 0.8 以 上 。 利 用 
PASS 《版 本 11) 及 G*Power《〈 版 本 3.1) 软件 进行 验算 ， 与 我 们 的 结果 一 致 ， 看 来 手动 寻 
值 法 还 是 容易 出 错 。 我 们 继续 利用 R 语言 作 图 直观 地 看 一 下 ， 样 本 量 199 时 检验 效能 首次 
达到 0.8， 而 样本 量 210 及 以 上 时 ， 检 验 效能 稳定 在 0.8 以 上 (图 1) 。 
j<-1;x<-c(0);y<-c(0) 
for (iin c(188:222)){ 
x[j]<-i 
y[j]<-exactpow(2,0.05,0.5,0.6,i) 
j<-j+1 
} 
plot(x,y,type="I",xlab=" 样 本 量 ",ylab=" 检 验 效 能 ") 
abline(h=0.8,Ity=3) 
abline(v=210,lty=3) 
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实例 2 

再 看 一 个 预期 率 小 于 目标 值 的 例子 ， 如 设 定 a=0.05， 已 知 总 体 率 ro=0.07， 预 期 的 总 体 
率 ra=0.03， 双 侧 检 验 ，80% 的 检验 效能 。 原 文 进行 SAs 编程 计算 ， 考 虑 到 检验 效能 的 非 单 
调 递 增 ， 最 终 样本 量 计算 结果 为 277 中 。R 语言 计算 如 下 : 

> exactn(2,0.05,0.2,0.07,0.03,2000) 

[1] 277 


讨论 

本 文 介绍 了 单 样本 率 比 较 的 样本 量 计算 确切 概率 法 的 R 语 言 实现 ， 该 方法 考虑 到 了 确 
切 概率 法 计算 时 检验 效能 与 样本 量 非 单 调 递 增 的 关系 ， 直 接 给 出 计算 结果 ， 也 可 作 图 直观 
显示 检验 效能 与 样本 量 的 关系 ， 所 有 计算 均 通 过 PASS 及 G*Power 软件 验证 。 
国内 已 有 作者 利用 SASW 3 或 stata 中 软件 编程 计算 ， 有 些 也 考虑 到 了 确切 概率 法 计算 时 
检验 效能 与 样本 量 的 非 单 调 递增 关系 >”， 我 们 的 方法 在 计算 确切 概率 时 与 前 者 是 一 致 的 ， 
但 寻 值 的 思路 是 从 一 个 较 大 的 样本 量 开始 ， 向 下 寻 值 直到 检验 效能 低 于 设 定 值 〈 比 如 
0.8) ， 然 后 再 返回 上 一 个 值 ， 即 为 所 求 样本 量 ， 这 样 在 编程 上 显得 更 为 简洁 ， 但 缺点 是 计 
算 量 可 能 会 较 大 ， 好 在 对 于 现代 计算 机 来 说 ， 这 并 不 是 个 问题 。 

文献 介绍 的 利用 样本 量 计算 软件 nQuery 需要 手动 寻 值 查找 样本 量 ， 容 易 出 错 巴 。 而 
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PASS 和 G*Power 软件 可 以 较为 方便 地 通过 作 图 找到 合适 的 样本 量 。 我 们 利用 R 语言 编程 ， 


直接 给 出 所 需 的 样本 量 ， 并 且 R 语言 是 免费 软件 ， 适 用 范围 会 更 广泛 。 
希望 本 文 能 有 助 于 这 类 研究 在 国内 的 有 效 开展 。 
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